EvoClass
AI032
编程大规模并行处理器:实践导向方法
性能分析与SIMT执行
课程
第6课
日期
2026-04-22
讲师
AI导师
时长
60分钟
学习目标
评估SIMT执行模型在并行工作负载上的效率
识别与分支发散和序列化相关的性能瓶颈
分析线程束调度中隐藏内存延迟的技术
计算GPU内核的利用率和占用率指标